在过去的十年中,基因组数据的可用性已成倍增长,这主要是由于新测序技术的发展。基于从增加的基因组数据中提取的基因(和基因产物)之间的相互作用,许多研究集中在基因与功能之间的关联鉴定上。尽管这些研究表现出了很大的希望,但用功能注释基因的问题仍然是一个悬而未决的挑战。在这项工作中,我们提出了一种检测层次多标签分类数据集中缺失注释的方法。我们提出了一种通过将汇总概率计算到每个实例的从叶子到根的类路径来利用类层次结构的方法。提出的方法是在预测缺失基因函数注释的背景下提出的,其中这些汇总概率被进一步用于选择一组通过体内实验验证的注释。各种大米的Oriza Sativa Japonica的实验,将类别的层次结合到该方法中通常会改善预测性能,而我们所提出的方法与文献相比,我们提出的方法可以提高结果。
translated by 谷歌翻译